رتبه بندی اسناد وب بر اساس یادگیری تقویتی

پایان نامه
چکیده

چالش اصلی در غالب موتورهای جستجو، رتبه بندی اسناد بازیابی شده برای ارائه بهترین پاسخ به پرس و جوی کاربران است. در این پایان نامه با فرموله کردن این مسئله با استفاده از مفاهیم یادگیری تقویتی، دو الگوریتم جدید رتبه بندی مبتنی بر اتصال با عناوین rl_rank و rurl ارائه شده است. یادگیری تقویتی یک تکنیک قویِ هوش مصنوعی است که حول جایزه گذر بین حالت ها و تابع ارزش، عمل می کند. در الگوریتم rl_rank، هر صفحه ی وب به عنوان یک حالت لحاظ شده که کاربر همانند یک موج سوار تصادفی بین آن ها حرکت می کند. حرکت بین صفحات با کلیک کردن بر روی یکی از پیوندهای خروجی صفحه جاری با احتمال مساوی می باشد. در این الگوریتم، به ازای گذر از هر حالت (صفحه) به حالت دیگر جایزه ای در نظر گرفته می شود و با استفاده از تعریف تابعِ ارزش هر صفحه به عنوان ارزش آن، صفحات رتبه بندی می شوند. در ضمن یک روش ترکیبی از ترکیب وزن دار rl_rank و bm25 نیز ارائه شده است. الگوریتم rurl طبق تعاریف rl_rank می باشد، با این تفاوت که این روش بر خلاف الگوریتم rl_rank وابسته به پرس وجو است. در این روش ابتدا زیر گرافی با توجه به پرس وجوی وارد شده، تشکیل می شود و سپس ایده گفته شده بر روی آن اعمال می شود. الگوریتم های ارائه شده بر روی مجموعه محک های معروف dotir و trec-2003 ارزیابی شدند و سپس نتایج بدست آمده بر اساس معیارهای مربوطه آنالیز شدند. نتایج آزمایش ها نشان دادند که الگوریتم های ارائه شده به ترتیب عملکرد بسیار بهتری نسبت به الگوریتم های معروف pagerank و hits بر روی هر دو مجموعه محک دارند. همچنین نتایج حکایت از پیشرفت قابل توجهی در الگوریتم های رتبه بندی با استفاده از مفاهیم یادگیری تقویتی دارد.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

رتبه بندی اسناد وب بر اساس روش های انتشار وابستگی

در سالیان اخیر استفاده از وب به عنوان منبع اصلی کسب اطلاعات، رشد فزاینده ای داشته است. از جمله ابزارهای بسیار کارآمد برای جستجو در وب، موتورهای جستجو هستند و چالش اصلی موتورهای جستجو، رتبه بندی نتایج بازیابی شده در پاسخ به پرس وجوی کاربر است. تاکنون الگوریتم های مختلفی بدین منظور ارائه شده اند که به دو دسته کلی الگوریتم های مبتنی بر محتوا مانند tf-idf و bm25 و مبتنی بر اتصال مانند pagerank، dis...

15 صفحه اول

رتبه بندی بانک های ایران بر اساس وضعیت توجه به حاکمیت شرکتی در اسناد بالادستی بانک

هدف از این پژوهش بررسی و تحلیل محتوای اسناد بالادستی (شامل چشم انداز، ماموریت، اهداف، منشور اخلاقی و ارزش­های بنیادین) 36 بانک و موسسات اعتباری فعال در نظام بانکداری بدون ربای ایران از منظر حاکمیت شرکتی و مقولات و مفاهیم (متعارف و اسلامی) موجود در آن می­باشد. در این مقاله پس از بررسی ادبیات حاکمیت شرکتی و تحقیقات پیشین در این موضوع به بررسی و تحلیل اسناد بالادستی بانک­های ایران پرداخته و مقولات...

متن کامل

رتبه بندی شرکت‌های داوطلب مشاوره بر اساس روش تلفیقی

هدف از این تحقیق، ارائه یک مدل تصمیم‌گیری چند شاخصه فازی و استفاده از خوشه‌بندی فازی برای ارزیابی و خوشه‌بندی شرکت‌های مشاور متقاضی همکاری با سازمان و تصمیم‌گیری در مورد آن‌ها است. با افزایش روزافزون اهمیت ساختارهای خرید خدمات، تصمیم‌گیری در مورد انتخاب شرکت‌های مشاور، برای سازمان‌ها باید با دقت و خبرگی بیشتری همراه باشد. انتخاب شرکت های مشاور برای یک سازمان، فرآیندی مبتنی بر داده‌های کیفی و کم...

متن کامل

رتبه بندی بانک های ایرانی بر اساس توان مالی

این پژوهش با هدف رتبهبندی بانکهای ایرانی و بهطور مشخص بانکهای دارای مجوز بانک مرکزی و پذیرفته شده در بورس اوراق بهادار تهران و فرابورس ایران بر اساس توان مالی آنها انجام شده است. قلمرو زمانی پژوهش حاضر در برگیرنده دوره 5 ساله از سال 1390 تا سال 1394 می باشد. در این پژوهش با استفاده از یک مدل مؤلفهمحور انعکاسی که از 4 بُعد، 8 مؤلفه و 51 شاخص تشکیل شده، امتیاز توان مالی بانکها به صورت سالانه برای ...

متن کامل

رتبه بندی هوشمند اسناد وب با استفاده از روش های جفتی

امروزه به دلیل حجم عظیم اطلاعات در وب و همچنین پویا بودن اطلاعات، مهم ترین چالش در بازیابی اطلاعات وب، خصوصاً موتورهای جستجو، رتبه بندی نتایج در پاسخ به پرس و جوی کاربر است. تاکنون الگوریتم های متنوعی که مبتنی بر محتوا و اتصال می باشند ارائه شده اند. علاوه بر روش های سنتی، روش های نوینی با عنوان روش های یادگیری جهت رتبه بندی مطرح شده است که به طور خلاصه عبارت است از ایجاد یک مدل خودکار رتبه بندی...

بهره گیری از بازخورد کاربر در روش های هوشمند تعاملی رتبه بندی اسناد وب

امروزه رتبه بندی مبتنی بر یادگیری به مبحث تحقیقاتی مهمی در زمینه ی بازیابی اطلاعات تبدیل شده است. در حقیقت یک داستان یکسان برای روش های رتبه بندی اتفاق می افتد. در این داستان، هدف فراهم کردن مدل رتبه بندی بر طبق ارتباط بین اسناد و پرس وجو است که اسناد را به عنوان ورودی دریافت کند و لیست اسناد را بر حسب میزان مرتبط بودنشان به پرس وجوی کاربر مرتب کند. در این پایان نامه، سه الگوریتم رتبه بندی مبتن...

15 صفحه اول

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - پژوهشکده برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023